7.8 비용 효율적인 LLM 오라클 운영 전략 7.8.1 고비용 모델(GPT-4 등)의 지식을 증류(Distillation)하여 저비용 평가 모델 구축 7.8.2 계층적 평가(Cascading Evaluation): 저비용 모델 선행 후 필요 시 고비용 모델 투입 7.8.3 평가 결과의 캐싱(Caching) 및 재사용 전략 7.8.4 배치 처리(Batch Processing)를 통한 평가 API 호출 최적화 7.8.5 토큰 사용량 절감을 위한 평가 프롬프트 압축 기법